13.2 옵션 프레임워크와 SMDP (The Options Framework & SMDP)
- 13.2 옵션 프레임워크와 SMDP (The Options Framework & SMDP)
- 13.2.1 옵션(Options)의 수학적 정의: 시작 집합(Initiation Set), 내부 정책(Intra-option Policy), 종료 조건(Termination Condition)
- 13.2.2 Semi-Markov Decision Process (SMDP): 가변적인 시간 간격을 다루기 위한 MDP의 확장 이론
- 13.2.3 Call-and-Return 실행 모델: 상위 정책(Meta-Controller)과 하위 정책(Controller) 간의 제어권 이양 프로세스